规划很有用。它让人们采取具有可取的长期后果的行动。但是,规划很难。它需要思考后果,这会消耗有限的计算和认知资源。因此,人们应该规划他们的行动,但他们也应该聪明地部署用于规划行动的资源。换句话说,人们也应该“规划他们的计划”。在这里,我们将规划的这一方面表述为元推理问题,并将其形式化为一个递归贝尔曼目标,该目标结合了任务奖励和信息论规划成本。我们的解释对人们应该如何根据任务的整体结构进行规划和元规划做出了定量预测,我们在两个有人类参与者的实验中对此进行了测试。我们发现,人们的反应时间反映了信息处理的计划使用,这与我们的解释一致。这种规划计划的表述为人类和机器中的分层规划、状态抽象和认知控制的功能提供了新的见解。
![arXiv:2002.05769v1 [cs.AI] 2020 年 2 月 13 日PDF文件第1页](/bimg/c/cd14c902302ae15006caa1618cdaacb191ee7a48.webp)
![arXiv:2002.05769v1 [cs.AI] 2020 年 2 月 13 日PDF文件第2页](/bimg/9/9485c97e996e4659cc6a97048ea73bb2cce14880.webp)
![arXiv:2002.05769v1 [cs.AI] 2020 年 2 月 13 日PDF文件第3页](/bimg/1/1bef28f6f53c5a405582dd37f2b7a73ba02053ba.webp)
![arXiv:2002.05769v1 [cs.AI] 2020 年 2 月 13 日PDF文件第4页](/bimg/2/2bdb08a58059a744905a83b22a84b627141c1469.webp)
![arXiv:2002.05769v1 [cs.AI] 2020 年 2 月 13 日PDF文件第5页](/bimg/6/6d6f3a65acb2704f20c367ac413fa2192c957f97.webp)
